24 research outputs found

    The analysis of cybersecurity subject area terms based on the information diffusion model

    Get PDF
    This research describes a comparison of the information diffusion model, built on the basis of cellular automata with the real statistics the dynamics of the use of terms from the field of cybersecurity in the information flows of the Internet. The information diffusion model is used with different parameters of the intensity of the information propagation. The cross-correlation of dynamics of the dissemination of new information in the model with the dynamics of the occurrence of concepts of the real subject area has been calculated. A high correlation dynamic of the terms occurrence with the dynamics given by the model at the selected parameters is shown. The research results allow fixing the model parameters that can further perform forecasting. The advantage of the information diffusion model based on cellular automata is the simplicity and clarity of a small number of parameters, and the ability to change them in accordance with the data on the actual occurrence of special terminology in information flows. The dynamics of the information diffusion model under various parameters allows us to determine centroids for the subsequent clustering of domain terms

    GPT Semantic Networking: A Dream of the Semantic Web – The Time is Now

    Get PDF
    The book presents research and practical implementations related to natural language processing (NLP) technologies based on the concept of artificial intelligence, generative AI, and the concept of Complex Networks aimed at creating Semantic Networks. The main principles of NLP, training models on large volumes of text data, new universal and multi-purpose language processing systems are presented. It is shown how the combination of NLP and Semantic Networks technologies opens up new horizons for text analysis, context understanding, the formation of domain models, causal networks, etc. This book presents methods for creating Semantic Networks based on prompt engineering. Practices are presented that will help build semantic networks capable of solving complex problems and making revolutionary changes in the analytical activity. The publication is intended for those who are going to use large language models for the construction and analysis of semantic networks in order to solve applied problems, in particular, in the field of decision making.У книзі представлені дослідження та практичні реалізації технологій обробки природної мови (НЛП), заснованих на концепції штучного інтелект, генеративний ШІ та концепція складних мереж, спрямована на створення семантичних мереж. Представлено основні принципи НЛП, моделі навчання на великих обсягах текстових даних, нові універсальні та багатоцільові системи обробки мови. Показано, як поєднання технологій NLP і семантичних мереж відкриває нові горизонти для аналізу тексту, розуміння контексту, формування моделей домену, причинно-наслідкових мереж тощо. У цій книзі представлені методи створення семантичних мереж на основі оперативного проектування. Представлені практики, які допоможуть побудувати семантичні мережі, здатні вирішувати складні проблеми та вносити революційні зміни в аналітичну діяльність. Видання розраховане на тих, хто збирається використовувати велику мову моделі побудови та аналізу семантичних мереж з метою вирішення прикладних задач, зокрема, у сфері прийняття рішень

    Сравнительная оценка критериев центральности в иерархических сетях

    Get PDF
    В даній статті викладено дослідження центральності в ієрархічних мережах. Наведено та проаналізовано деякі характеристики центральності графів. Сформульовано основні критерії центральності. Запропоновано багатокритеріальну оцінку вузлів графа. В рамках проведеного дослідження розроблено відповідне математичне та програмне забезпечення. Проведено експериментальне дослідження ефективності сформульованих критеріїв.The research of centrality in hierarchical networks is presented in the paper. The characteristics of graph centrality are analyzed and discussed. The basic centrality criteria are defined. The multi-objective assessment of graph nodes is proposed. The appropriate mathematical support and software have been developed within the framework of conducted research. The experimental research of the formulated criteria efficiency has been carried out as well.В данной статье изложено исследования центральности в иерархических сетях. Приведено и проанализировано некоторые характеристики центральности графов. Сформулировано основные критерии центральности. Предложено многокритериальную оценку узлов графа. В рамках проведенного исследования разработано соответствующее математическое и программное обеспечение. Проведено экспериментальное исследование эффективности определенных критериев

    Reference functions of cyber incidents displaying in the media space

    Get PDF
    The principles of cyber attacks detection that based on media content are described. Proposed methods are suitable for description of the general trends in the dynamics of information flows concerning cyber incidents. A generalized diagram of cyber attacks stages displaying in the media space is proposed. On the basis of the diagram the basic wavelet functions are selected, which can be considered as a reference for detecting cyber incidents. The proposed wavelets are low-order derivatives of Gaussian function (Wave, «Mexican Hat» and Morlaix wavelets). Retrospective analysis of already implemented information operations is a reliable way to verify them. The problem of forecasting is partly solved by probabilistic estimates in accordance with the type of reference functions

    OSINT as a part of cyber defense system

    Get PDF
    The paper presents the results of research on the development of fundamental and applied principles for analyzing information flows in global computer networks while conducting open source intelligence (OSINT). The relevance of this task, in particular, concerning the provision of cyber security, the parameters of the modern information space, the existing theoretical and technological solutions are substantiated. The description of methodological and instrumental means of analysis and modeling of information flows, distributed content monitoring of global networks, the creation of multilingual full-text databases, analysis of the dynamics of thematic information flows with the use of nonlinear analysis, automatic formation of models of subject areas in the field of cyber security are presented

    Метод виявлення критичних інформаційних джерел в глобальній мережі Інтернет

    No full text
    One of the important segments of the media system in modern conditions is a set of Internet sources. The results of sociological research showed that the number of Internet users continuously increases. The most popular network access devices were mobile phones and tablets. This allowed us to expand the range of services provided through the global network. Consumers of information from the Internet increasingly trust it: first of all, the mass media and social networks. This feature is used, inter alia, for manipulative purposes during the conduct of information wars and attacks to suggest false information to users. The work of the media system involves a complex process of bringing information messages in various formats to almost any person without external participation. In this case, for the functioning of the Internet media, usually, it is necessary only to create and maintain a site that doesn't require significant financial costs, as for traditional media.  The server can be located anywhere in the world and registering as a mass media requires an application and a little bit of money.  Such conditions of creation and functioning allow exerting external influence on the work of the mass media system on the Internet. In this paper, the stability of mass media sources is investigated and proposed a method that can identify unstable sources, which are likely to be used as a tool for manipulating people minds during information wars. There are 4 types of processes occurring with information sources during their life cycle: the source publication process was almost unchanged, a rapid decrease in the number of publications by the source almost to its stop, the short-term increase in the number of publications by the source, the increase in the number of publications by the source, which was held on a permanent basis.Одним із значущих сегментів системи засобів масової інформації в сучасних умовах є сукупність джерел мережі Інтернет. Результати соціологічних досліджень показали, що безперервно збільшується кількість користувачів мережею Інтернет. Найпопулярнішими пристроями доступу до мережі виявились мобільні телефони та планшети. Це дозволило розширити спектр послуг, які надаються за допомогою глобальної мережі. Споживачі інформації з мережі Інтернет все більше довіряють їй: в першу чергу засобам масової інформації та соціальним мережам. Ця особливість використовується, в тому числі, і в маніпулятивних цілях під час ведення інформаційних війн та атак для навіювання неправдивої інформації користувачам. Робота системи засобів масової інформації орієнтована на доведення інформаційних повідомлень в різних форматах практично до будь-якої людини без зовнішньої участі. При цьому для функціонування засобів масової інформації мережі Інтернет, зазвичай, необхідне лише створення та підтримання сайту, що не вимагає серйозних фінансових витрат для традиційних засобів масової інформації. Сервер може розташовуватися в будь-якій точці світу, а реєстрація як засобу масової інформації вимагає оформлення заявки і оплати незначних коштів. Такі умови створення і функціонування дають можливість здійснювати зовнішній вплив на функціонування системи засобів масової інформації у мережі Інтернет. У даній роботі досліджено стабільність джерел засобів масової інформації та запропоновано метод, який дозволяє виявляти критичні джерела, які з великою імовірністю використовуються як інструмент для маніпуляції свідомістю людей під час проведення інформаційних війн. Виявлено 4 види процесів, що відбуваються з інформаційними джерелами під час їх життєвого циклу: майже не змінний процес публікувань джерелом, стрімке зменшення кількості публікацій джерелом майже до його зупинки, короткострокове збільшення кількості публікацій джерелом, збільшення кількості опублікувань джерелом, що відбулось на постійній основі

    Ранжування вузлів квазіієрархічних мереж соціального характеру за логарифмічними вагами їх зв’язків

    No full text
    Networks of social nature are the basis of all interactions between participants (usually people) that occur in the process of transferring information between them. Recently, the use of such networks is gaining in popularity. According to expert estimates in these networks, it is possible to get a lot of valuable information about their participants: from personal data (place of residence, contact number, e-mail address) to behavior and assessment of flavors. When evaluating a social networks, graphs representing the real interaction of nodes in such networks are represented. For evaluation, it is necessary to rotate the nodes, to conduct their detailed analysis, to evaluate the results obtained according to all the given criteria and to allocate among them the most influential. Existing algorithms for ranking in the overwhelming majority are estimated only by hierarchical networks, which does not allow to clearly determine the influence of nodes among themselves. The large number of links between nodes in social networks and their diverse distribution in most cases does not allow for the use of algorithms ranking the basic form, because the ignoring of minor, at first glance, linkages leads to false results. The paper analyzes the ranking of nodes and compares the results of the known algorithms for ranking the nodes HITS, PageRank with expert evaluation of the network. For the efficiency of the quasi-hierarchical networks research, the basic HITS algorithm was modified, which allows to analyze and rank nodes according to the given criteria (the number of input and output links among themselves). This is consistent with the results of expert evaluation. It is shown that due to the use of the modified algorithm results are obtained that correspond to real social connections between the subjects, and the indexes of the authorship of the nodes - to the previously provided social roles. The resulting algorithm allows you to evaluate and identify the most significant nodes in social networks and can be used in various industries where social networks are formed.Сети социального характера является основой всех взаимодействий между участниками (как правило, людьми), происходящие в процессе передачи информации между ними. За последнее время использование таких сетей все больше набирает популярность. По оценке экспертов в данных сетях можно получить много ценной информации об их участниках: от персональных данных (место жительства, контактный номер телефона, адрес электронной почты) к поведению и оценки вкусов. При оценке сети социального характера представляются графами, отражающие реальное взаимодействие узлов в таких сетях. Для оценки нужно проранжировать узлы, провести их детальный анализ, оценить полученные результаты по всем заданным критериям и выделить среди них наиболее влиятельные. Существующие алгоритмы ранжирования в большинстве оценивают только иерархические сети, что не позволяет четко определить влиятельность узлов между собой. Большое количество связей между узлами в сетях социального характера и их разнообразное распределение в большинстве случаев не позволяет использовать алгоритмы ранжирования базового вида потому, что неучет незначительных, на первый взгляд, связей приводит к ошибочным результатам. В работе приводится анализ процесса ранжирования узлов и сравниваются полученные результаты работы известных алгоритмов ранжирования узлов HITS, PageRank и экспертной оценке сети. Для эффективности исследования квазииерархичних сетей, модифицировано базовый алгоритм HITS, что позволяет проводить анализ и ранжирование узлов по заданным критериям (количества входных и выходных связей между собой). Это согласуется с результатами экспертной оценки. Показано, что благодаря использованию модифицированного алгоритма получаются результаты, соответствующие реальным социальным связями между субъектами, а показатели авторства узлов - предварительно предоставленным социальным ролям. Полученный алгоритм позволяет оценить и выявлять наиболее значимые узлы в сетях социального характера и может использоваться в различных областях, где формируются социальные сети.Мережі соціального характеру є основою всіх взаємодій між учасниками (зазвичай, людьми), що відбуваються в процесі передавання інформації між ними. За останній час використання таких мереж все більше набирає популярності. За оцінкою експертів у даних мережах можливо отримати багато цінної інформації про їх учасників: від персональних даних (місце проживання, контактний номер телефону, адресу електронної скриньки) до поведінки та оцінки смаків. При оцінюванні мережі соціального характеру представляються графами, що відображають реальну взаємодію вузлів у таких мережах. Для оцінювання потрібно відранжувати вузли, провести їх детальний аналіз, оцінити отримані результати за всіма заданими критеріям та виділити серед них найбільш впливові. Існуючі алгоритми ранжування в переважній більшості оцінюють тільки ієрархічні мережі, що не дозволяє чітко визначити впливовість вузлів між собою. Велика кількість зв’язків між вузлами у мережах соціального характеру та їх різноманітний розподіл в більшості випадків не дозволяє використовувати алгоритми ранжування базового виду тому, що неврахування незначних, на перший погляд, зв’язків призводить до хибних результатів. У роботі приводиться аналіз процесу ранжування вузлів та порівнюються отримані результати роботи відомих алгоритмів ранжування вузлів HITS, PageRank з експертною оцінкою мережі. Для ефективності дослідження квазіієрархічних мереж, модифіковано базовий алгоритм HITS, що дозволяє проводити аналіз та ранжування вузлів за заданим критеріям (кількості вхідних і вихідних зв’язків між собою). Це узгоджується з результатами експертної оцінки. Показано, що завдяки використанню модифікованого алгоритму отримуються результати, що відповідають реальним соціальним зв’язками між суб’єктами, а показники авторства вузлів – попередньо наданим соціальним ролям. Отриманий алгоритм дозволяє оцінити і виявляти найбільш значимі вузли в мережах соціального характеру та може використовуватися у різних галузях, де формуються соціальні мережі

    Порівняльна оцінка критеріїв центральності в ієрархічних мережах

    No full text
    The research of centrality in hierarchical networks is presented in the paper. The characteristics of graph centrality are analyzed and discussed. The basic centrality criteria are defined. The multi-objective assessment of graph nodes is proposed. The appropriate mathematical support and software have been developed within the framework of conducted research. The experimental research of the formulated criteria efficiency has been carried out as well.Keywords: centrality, hierarchical networks, characteristics of centrality, centrality criteria, multi-objective assessment.В данной статье изложено исследования центральности в иерархических сетях. Приведено и проанализировано некоторые характеристики центральности графов. Сформулировано основные критерии центральности. Предложено многокритериальную оценку узлов графа. В рамках проведенного исследования разработано соответствующее математическое и программное обеспечение. Проведено экспериментальное исследование эффективности определенных критериев.Ключевые слова: центральность, иерархические сети, характеристики центральности, критерии центральности, многокритериальная оптимизация.В даній статті викладено дослідження центральності в ієрархічних мережах. Наведено та проаналізовано деякі характеристики центральності графів. Сформульовано основні критерії центральності. Запропоновано багатокритеріальну оцінку вузлів графа. В рамках проведеного дослідження розроблено відповідне математичне та програмне забезпечення. Проведено експериментальне дослідження ефективності сформульованих критеріїв.Ключові слова: центральність, ієрархічні мережі, характеристики центральності, критерії центральності, багатокритеріальна оптимізація

    Особливості побудови систем розподіленого контент-моніторингу глобальних інформаційних мереж

    No full text
    The properties of information flows are examined taking into account their belonging to segments of global networks. The article describes how to implement content-monitoring with taking to account continuous increasing complexity of the Internet segments and available for use practical methods of construction of distributed content monitoring systems. Particular importance attaches to this issue in carrying out activities aimed at preventing, timely detection, termination or neutralization of real and potential threats to state information security. Organization of effective counteraction to the challenges and threats to national security and its specific manifestations in the information sphere is one of the urgent tasks, the solution of which is an important task in terms of building civil society and the rule of law. Capture and synthesis of large dynamic content streams that are continuously generated in the Internet space requires qualitatively new methods and approaches to implement information security measures. Study of information needs and requirements formation for the implementation of similar systems suggests that the usage of distributed (segmented) content monitoring of global networks/media and f full set of interaction interfaces of segments of global networks and their monitoring tools is important in the process of content monitoring (scanning) of the Internet. The complexity of segments of the Internet as a software and technical objects is essential, not a secondary property. Designing software and hardware for distributed content monitoring of global networks / media, abstracting from both their complexity and their essence. The solution of such problems is based on the InfoStream content monitoring system. When building expert systems of distributed content monitoring, perceived the need to consider the level of popularity (availability) segment of the Internet and its efficiency in shaping the content, of different approaches to collecting and providing information interfaces interaction, so each “singled-out” segment of the global Internet is expedient of forming own knowledge base and receptions.Исследовано свойства информационных потоков с учетом их принадлежности к сегментам глобальных сетей. В статье рассматривается процесс осуществления контент-мониторинга с учетом постоянного повышения сложности сегментов сети Интернет и предлагаются для применения практические методы построения систем распределенного контент-мониторинга. Особое значение этот вопрос приобретает при осуществлении деятельности, направленной на предотвращение, своевременное выявление, пресечение или нейтрализацию реальных и потенциальных угроз информационной безопасности государства. Организация эффективного противодействия вызовам и угрозам национальной безопасности и ее конкретным проявлениям в информационной сфере – одна из насущных задач, решение которой является важным делом в условиях развития гражданского общества и правового государства современности. Охват и обобщение больших динамических контентных потоков, которые непрерывно генерируются в Интернет-пространстве, требует качественно новых методов и подходов к выполнению мероприятий по обеспечению информационной безопасности. Изучение информационных потребностей и формирование требований к построению аналогичных систем показывает, что в процессе осуществления контент-мониторинга сети Интернет важным является применение средств распределенного (сегментированного) контент-мониторинга глобальных сетей/медиа, а также использования полного набора интерфейсов взаимодействия сегментов глобальных сетей и инструментария их мониторинга (сканирования). Сложность сегментов сети Интернет, как программно-технических объектов является существенным, а не второстепенным свойством. Проектирование программно-технических средств распределенного контент-мониторинга глобальных сетей/медиа, которые абстрагируются от их сложности, часто абстрагируются и от их сущности. Предложено решение таких задач на базе системы контент-мониторинга InfoStream. При построении экспертных систем распределенного контент-мониторинга, усматривается необходимость учета уровня популярности (доступности) сегмента сети Интернет и его оперативности в формировании контента, различных подходов к накоплению и предоставлению информации, интерфейсов взаимодействия, поэтому для каждого “выделенного” сегмента глобальной сети Интернет целесообразно формировать собственную базу знаний и приемов.Досліджено властивості інформаційних потоків з урахуванням їх належності до сегментів глобальних мереж. У статті розглядається процес здійснення контент-моніторингу з урахуванням постійного підвищення складності сегментів мережі Інтернет та пропонуються для застосування практичні методи побудови систем розподіленого контент-моніторингу. Особливої ваги це питання набуває при здійснення діяльності, спрямованої на запобігання, своєчасне виявлення, припинення чи нейтралізацію реальних і потенційних загроз інформаційній безпеці держави. Організація ефективної протидії викликам та загрозам національній безпеці та її конкретним проявам у інформаційній сфері – одне з нагальних завдань, вирішення якого є важливим завданням в умовах розбудови громадянського суспільства та правової держави сьогодення. Охоплення та узагальнення великих динамічних контентних потоків, які безперервно генеруються в Інтернет-просторі, вимагає якісно нових методів та підходів до виконання заходів із забезпечення інформаційної безпеки. Вивчення інформаційних потреб та формування вимог для реалізації аналогічних систем свідчить, що в процесі здійснення контент-моніторингу мережі Інтернет важливим є застосування засобів розподіленого (сегментованого) контент-моніторингу глобальних мереж/медіа та використання повного набору інтерфейсів взаємодії сегментів глобальних мереж та інструментарію їх моніторингу (сканування). Складність сегментів мережі Інтернет, як програмно-технічних об’єктів є суттєвою, а не другорядною властивістю. Проектування програмно-технічних засобів розподіленого контент-моніторингу глобальних мереж/медіа, що абстрагуються від їх складності, часто абстрагуються і від їх сутності. Запропоновано вирішення таких задач на базі системи контент-моніторингу InfoStream. При побудові експертних систем розподіленого контент-моніторингу вбачається необхідність врахування рівня популярності (доступності) сегменту мережі Інтернет та його оперативності у формуванні контенту, різних підходів до накопичення та надання інформації, інтерфейсів взаємодії, тому для кожного “виокремленого” сегменту глобальної мережі Інтернет доцільно формувати власну базу знань та прийомів

    Нелінійні властивості мультиагентної моделі розповсюдження новин

    No full text
    Along with studying common statistic properties of time-series, wavelet-analysis and fractal analysis has been recently used with increased frequency for solving forecasting problems, revealing periodicities, anomalies. The paper deals with Nonlinear (fractal) characteristics (Hurst exponent) and wavelet-scaleograms of the information distribution agent-based model, suggested by the authors. Let us consider an agent-based model with the following performance parameters. Informative messages can be replicated (by way of “reposting”), they can contain links both to informative messages of similar content and to other objects of the real and the virtual world, they can “die” due to ageing etc. The agent’s evolution will be connected with the events, which happened to such agent. As regards to the principal characteristic, let us introduce the “energy”, which reflects the timeliness of the message and the degree of interest to it. It goes without saying, that ageing of information or negative reaction will reduce the message’s energy, and positive reaction or appearance of the link to such message will increase its energy. The authors have studied the effect of Hurst exponent change depending upon the model parameters, which have semantic meaning. The paper also considers fractal characteristics of real information streams. It describes how the Hurst exponent dynamics depends on these information streams state in practice. The authors have suggested an approach to modeling and further forecast of real information streams by changing the model parameters during its operation. With the help of the model and case-studies it has been shown, that it is possible to reveal changes in behavior of real information streams by analyzing changes in the dynamics of Hurst exponent. The diagram of Hurst exponent dynamics has been compared with the wavelet-scaleogram. A more effective algorithm of Hurst exponent evaluation permits recommending constant observation over this parameter dynamics in course of analytical work. Besides, it allows forecasting the information streams’ behavior on the grounds of Hurst parameter value.Наряду с изучением простых статистических свойств временных рядов, для решения задач прогнозирования, выявления периодичностей, аномалий, все чаще используется вейвлет- и фрактальный анализ. В работе исследованы нелинейные (фрактальные) характеристики (показатель Херста) и вейвлет-скейлограммы предложенной модели распространения информации, которая соответствуют реальному информационному процессу. Рассматривается мультиагентная модель, параметры функционирования которой следующие. Информационные сообщения могут тиражироваться (путем “репостинга”), содержать ссылки как на близкие по смыслу информационные сообщения, так и на другие объекты реального или виртуального мира, “умирать” из-за старения. При этом эволюция агента будет связана с событиями, которые с ним происходят. В качестве основной характеристики агента вводится “энергия”, которая отображает актуальность сообщения и степень интереса к нему. Предложен подход к моделированию и последующему прогнозированию реальных информационных потоков, путем изменения параметров модели во время ее работы. Исследован эффект изменения показателя Херста от параметров модели, имеющих смысловые значения. Рассмотрены также фрактальные характеристики реальных информационных потоков. Показано, как динамика показателя Херста на практике зависит от состояния этих информационных потоков. Выполнено сопоставление графика динамики показателя Херста и вейвлет-скейлограмм. Алгоритм вычисления показателя Херста ввиду своей эффективности позволяет рекомендовать постоянное наблюдение динамики этого параметра в процессе аналитической работы. Это обеспечивает возможность прогнозирования поведения информационных потоков по значению параметра Херста.Поряд з вивченням простих статистичних властивостей часових рядів, для вирішення завдань прогнозування, виявлення періодичностей, аномалій, все частіше використовується вейвлет і фрактальний аналіз. В роботі досліджено нелінійні (фрактальні) характеристики (показник Херста) і вейвлет-скейлограмми запропонованої моделі поширення інформації, яка відповідає реальному інформаційному процесу. Розглядається мультиагентна модель, параметри функціонування якої такі. Інформаційні повідомлення можуть тиражуватися (шляхом “репостингу”), містити посилання як на близькі за змістом інформаційні повідомлення, так і на інші об’єкти реального або віртуального світу, “вмирати” через старіння тощо. При цьому еволюція агента буде пов’язана з подіями, які з ним відбуваються. В якості основної характеристики агента вводиться “енергія”, яка відображає актуальність повідомлення і ступінь інтересу до нього. Запропоновано підхід до моделювання і подальшого прогнозування реальних інформаційних потоків, шляхом зміни параметрів моделі під час її роботи. Досліджено ефект зміни показника Херста від параметрів моделі, що мають смислові значення. Розглянуто також фрактальні характеристики реальних інформаційних потоків. Показано, як динаміка показника Херста на практиці залежить від стану цих інформаційних потоків. Виконано зіставлення графіків динаміки показника Херста і вейвлет-скейлограмм. Алгоритм обчислення показника Херста зважаючи на свою ефективності дозволяє рекомендувати постійне спостереження динаміки цього параметра в процесі аналітичної роботи. Це забезпечує можливість прогнозування поведінки інформаційних потоків за значенням параметра Херста
    corecore